DATOS DE POBREZA COMUNAL

Hoy trabajaremos con datos de pobreza comunal, los cuales corresponden a datos censales del 2017 calculados por el Instituto Nacional de Estadística. Notar que hemos creado el objeto “params”, el cual contiene la variable “reg” (de región). Intente cambiar el valor de reg al inicio del archivo (de 1 a 16) y vea como se puede automatizar los scripts para trabajar con distintas regiones sin mayor esfuerzo.

Notamos que la clase del código comunal, con el cual más adelante utilizaremos para hacer merge entre distintas bases, es de clase numérica. Po otro lado, la clase de los códigos comunales en el resto de las bases es de clase factor o character. En consecuencia, es necesario cambiar la clase de dicha varible y anteponer un “0” a aquellos códigos comunales que se encuentren por debajo de “10000” (dado que siendo clase numérica no considera los ceros al lado izquierdo). También se puede observar que la clase de la variable de pobreza comunal está en clase character, por lo que la cambiamos a variable numérica para tener una escla continua.

Una vez arreglado estos problemas, hacemos un merge entre la base que contiene los datos de pobreza y la base que posee los vectores para generar los polígonos de las comunas. También modificamos la clase de la variable de codigo regional, de tal manera de poder filtrar mediante el parametro “reg” creado en “params”reg".

Creamos un objeto que contenga el nombre de las regiones (ordenadas por orden de region). Luego, graficamos la región seleccionada y establecemos el porcentaje de pobreza comunal como el “fill” de las comunas. Esto permite observar que comunas son más vulnerables dentro de una región.

Si bien el porcentaje de individuos pobres en cada comuna es relevante, este no deja de ser relativo al número total de personas que viven en dicha comuna. Si estubiesemos estudiando la distribución geográfica de los pobres en una región, pudiese ser más relevante saber el número de personas que son pobres, y no tanto el porcentaje (un 5% de pobres en Las Condes no es lo mismo que un 5% de pobres en Camarones). Por lo tanto, es necesario ajustar la variable de pobreza comunal (mejor crear una nueva variable).

Una vez trabajada la base, repetimos el proceso de mapeo y observamos las diferencias entre los valores relativos y absolutos.

AGREGANDO LOCALICAZACIÓN GEORREFERENCIADA DE ESTABLECIMIENTOS PÚBLICOS

Supongamos que deseamos observar la distribución de hospitales y escuelas municipales de la región, de tal manera de ver si existe alguna tendencia a la existencia de estos según el número de pobres (o porcentaje de pobreza) de la comuna. Los datos pueden encontrarse en la pagina web de IDE Chile, la cual posee datos georeferenciados de múltiples aspectos territoriales (http://www.ide.cl/index.php/informacion-territorial/descargar-informacion-territorial).

Por temas simplemente estéticos, modificaremos el texto de las variables referentes a los nombres de las comunas, hospitales y establecimientos municipales (tendrá mayor uso cuando veamos la versión highcharter de los mapas).

Es dificil encontrar bases de datos sin errores y, en este caso, dichas bases no se encuentran libre de estos. Si uno omite el siguiente chunck notará que las localizaciones de los hospitales de ciertas regiones se encuentran desfazados de la ubicación geográfica que estamos graficando. Esto se debe a que hay errores de codificación de las regiones (que es con la variable que filtramos para graficar una sola region), lo cual genera que ciertas regiones grafiquen ubicaciones de establecimientos públicos de otras regiones. Corregimos dichos errores reasignando el código correcto a la región mediante la función “grepl” (permite buscar patrones de texto o números en variables o vectores). Notar que corregimos el código de las regiones mediante el nómbre de estas, dado que corregir mediante el mismo código llevaría a sobreescribir los datos previamente corregidos de otras regiones.

Ahora quehemos modificado los errores, filtramos por aquellos establecimientos públicos de interés. En el caso de la base de datos de establecimientos de salud, supongamos que solo nos interesan los hospitales (servicios de salud). En el caso de los establecimientos de educación, solo nos interesan los establecimientos municipales.

En el caso de escuelas muncipales, notamos que la categoría “municial” puedes ser modificada a “Escuela Municipal”. Para eso es necesario seleccionar la letra “M” de “municipal” y agregarle también el prefijo “Escuela”.

Utilizamos la función rbind para generar una sola base que contenga: longitud, latitud y la categoría del establecimiento (Escuela Munciciapl o Servicios de Salud).

Agregamos los datos de las ubicación georreferenciadas al mapa regional de pogreza porcentual comunal.

Nuevamente puede exisitir diferencias entre los valores relativos a la población y los valores absolutos de pobres en la comuna. Por lo tanto, graficamos nuevamente considerando el número de pobres totales de cada comuna.

Grafico Highcharter

Supongamos que sería util saber inmediatamente el nombre del establecimiento público, así tambien como ver el porcentaje de pobreza comunal y el número de pobres en un mismo gráfico. En ggplot eso podría ser un problema, puesto que siendo graficos estáticos, tener mucho texto en sectores con muchos establecimientos conglomerados (como ciudades) pudiese ser polo legible. Highcharter ofrece una posible solución, dada su capacidad de generar gráficos dinámicos. Primero modificamos los valores (los de pobreza comunal para expresarlos en porcentaje los de personas para expresarlos redondeados), de tal manera de ser más entendible el gráfico.

Una de las condiciones para poder trabajar con mapas en highcharter es que el mapa ya no tiene que ser de clase “data.table”, sino de clase “geojson” y luego ser transformado a lista (estoúltimo en el caso de la base que contenga los vectores para generar el gráfico). Los objetos que contengan bases de datos con ubicaciones georreferenciadas (como los hospitales y establecimientos de educación) deben ser formato “sf”. Esto se puede hacer con los paquetes “jsonlite” y “geojsonio”.

Una vez tenemos las bases de datos listas, generamos el grafico highcharter agregando los datos de pobreza comunal y número de pobres totales.

Repetimos el caso para el número de pobres totales de la comuna,de tal manera de observar nuevamente lo visot en el gráfico n°2 de la versión ggplot.

Si ahora deseamos agregar los datos de salud y educación, utilizamos la función “hc_add_series” fde highcharter. Notamos que, al ser dinámico, podemos seleccionar los datos de educación y salud por separado, o bien todo junto.

Repetimos nuevamente, pero conciderando el número total de pobres (y no el relativo) como método de distribución de valores.